对话模型安全性分类法数据集基准对话安全分类器

对话模型的安全性研究：分类法、数据集和基准

0关于对话模型的安全性：分类法、数据集和基准0Hao Sun 1�，Guangxuan Xu 2�，Jiawen Deng 1，Jiale Cheng 1，Chujie Zheng 1，Hao Zhou 3，Nanyun Peng2，Xiaoyan Zhu 1，Minlie Huang 1†01...

NLP中的对话机器人——预训练基准模型

标签：自然语言处理机器人 python

BERT和ELMo基准模型的实现示例。

深度学习关键要素：数据集汇总与分享

标签：深度学习人工智能数据集

在深度学习的应用中，数据被...在选择数据集时，不仅需要关注数据量的大小、多样性以及质量，还要考虑数据集是否代表了所研究问题的真实情况。本文整理了当前深度学习领域公开的数据集，供大家训练模型时选择和使用。

每周编辑精选｜在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

标签：金融人工智能数据集

此举填补了国内该领域数据的空白，对相关研究具有重要意义。...目前，AI 领域对金融模型的研究成果大多是基于公共知识进行训练的，但在实际的金融实践中，这些公共知识对于当前市场的可解释性往往严重不足。

大语言模型(LLM)综述(六)：大型语言模型的基准和评估

标签：语言模型人工智能自然语言处理

为了检验LLM的有效性和优越性，已经提出了大量任务和基准，用于进行经验能力评估和分析。在本节中，我们首先介绍了LLM在语言生成和理解方面的三种基本能力评估类型，然后介绍了几种具有更复杂设置或目标的LLM的高级...

LLM - 大模型技术报告与训练细节 By Baichuan2

标签：人工智能 LLM baichuan2

Baichuan2 模型技术报告整理与心得体会。

BloombergGPT—金融领域大模型

标签：金融大模型垂直领域

在通用任务上，BloombergGPT的综合得分优于相同参数量级的其他模型，并且在某些任务上的得分要高于参数量更大的模型。这都说明，开发金融专用的大语言模型在金融领域取得好效果的同时，并没有以牺牲模型通用能力为...

《A Survey of Large Language Models大语言模型综述》的翻译与解读(一)之序言(挑战+LM四阶段+LLM与PLM的三...

标签：自然语言处理基础大模型 llama

《A Survey of Large Language Models大语言模型综述》的翻译与解读(一)之序言(挑战+LM四阶段+LLM与PLM的三大区别)、概述(两个代表性扩展定律/涌现能力三种典型/六大关键技术+GPT系列技术演进)、资源(开源模型/闭源...

从零开始构建大语言模型（MEAP）

标签：语言模型人工智能自然语言处理

"大型"语言模型中的"大"既指模型在参数方面的规模，也指其所训练的庞大数据集。这样的模型通常具有数百亿甚至数百亿个参数，这些参数是网络中的可调权重，在训练过程中进行优化，以预测序列中的下一个词。下一个词的...

基于重构-分类学习的人脸伪造检测

标签：端到端重构分类学习人脸伪造检测学习表示增强重建和分类学习基准数据集实验证明

分类学习人脸伪造检测曹俊义1马超1姚太平2沈晨2丁守宏2杨小康11上海交通大学2腾讯优图实验室{junyicao，chaoma，xkyang} @ sjtu.edu.cn{ taipingyao，kobeschen，ericshding} @ tencent.com摘要现有的人脸伪造检测器...

精卫填海——大数据安全与隐私保护

标签： big data 安全 web安全

在大数据场景下，数据的高速流动特性以及操作多样性使得数据的安全与效率之间的矛盾更加突出。如何实现大数据的安全共享在大数据访问控制中，用户难以信赖服务商正确实施访问控制策略，且在大数据应用中实现用户...

深度学习常用数据集汇总

标签：深度学习

深度学习常用数据集计算机视觉1.MNIST2.ImageNet3.CIFAR4.COCO5.PASCAL VOC6.FDDB自然语言处理数据集1.SQuAD2.MS MARCO3.Question Pairs4.Maluuba Datasets5.Maluuba NewsQA6.20 Newsgroups7.Billion Word Language ...

【医疗人工智能】通过强化学习和分类的自适应对齐进行有效的症状查询和诊断

标签：人工智能分类数据挖掘

Article 文献题目：Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue Generation 摘要医疗自动诊断系统旨在模拟人类医生在真实的诊断过程中。...此外，缺乏包含各种疾病和相应信息的公共评估数据集

LLMs:《OPT: Open Pre-trained Transformer Language Models》翻译与解读

标签：自然语言处理语言模型 OPT

LLMs:《OPT: Open Pre-trained Transformer Language Models》翻译与解读目录《OPT: Open Pre-trained Transformer Language Models》...4 Bias & Toxicity Evaluations偏见和有害性评估 5 Limitatio

AI最全数据集汇总：语音、歌声、音乐、图片、视频等领域开源数据集链接汇总

文章目录**音乐数据集**百万歌数据集**语音数据集**口语维基百科语料库语音...分类数据集THUCNews中文完形填空数据集清华大学开放中文词库中华古诗词数据库上百种预训练中文词向量《口袋妖怪》跨语种命名对照数据集中文...

网络空间安全导论

标签：安全网络

复习自用~

LLMs之Llama3：Llama 3的简介、安装和使用方法、案例应用之详细攻略

标签： Llama 3 大语言模型 llama

2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标准基准...

GPT-2生成式多轮对话入门-----深入理解“用于中文闲聊的GPT2模型”项目

深入理解“用于中文闲聊的GPT2模型”项目论文部分提炼DIALOGPT : Large-Scale Generative Pre-trainingfor Conversational Response Generation摘要介绍数据集方法模型结构本文为对于GPT2 for Chinese chitchat...

强化学习极简入门：通俗理解MDP、DP MC TC和Q学习、策略梯度、PPO

标签：强化学习 TRPO PPO

强化学习里面的概念、公式，相比ML/DL特别多，初学者刚学RL时，很容易被接连不断的概念、公式给绕晕，而且经常忘记概念与公式符号表达的一一对应(包括我自己在1.10日之前对好多满是概念/公式的RL书完全看不下去，...

Prompt-Tuning——深度解读一种新的微调范式

标签：自然语言处理深度学习人工智能

自从GPT、EMLO、BERT的相继提出，以Pre-training + Fine-tuning 的模式在诸多自然语言处理（NLP）任务中被广泛使用，其先在Pre-training阶段通过一个模型在大规模无监督语料上预先训练一个预训练语言模型（Pre-...

NLP大模型微调答疑

标签：自然语言处理人工智能深度学习

过程训练后的模型，其SFT阶段已经有上千指令微调任务训练过，现在我们只是新增了一类指令数据，相对大模型而已，微调数据量少和微调任务类型单一，不会对其原有的能力造成大的影响，所以我认为是不会导致灾难性遗忘...

基于对比对抗训练的文本分类任务微调方法

标签：对比对抗训练文本分类微调编码器 AI

Mo YufjIBM Watson†IBM ResearchAI§麻省理工学院-IBM沃森人工智能实验室fj{panl，hangc，avi，potdars，yum}@us.ibm.com摘要我们提出了一种简单而通用的方法来规范基于transformer的编码器的文本分类任务的微调。...

一文读懂「LLM的幻觉/涌现」问题

标签：人工智能深度学习机器学习

1、幻觉定义大模型生成看似合理的内容，其实这些内容是不正确的或者是与输入Prompt无关，甚至是有冲突的现象，即生成与用户输入不符、与先前生成的内容矛盾或与已知世界知识不符的内容。2、幻觉类型输入冲突幻觉...

信息安全概论笔记

标签：安全系统安全 web安全

这篇博客是我学习信息安全概论的笔记，本篇博客所使用的教材和课程连接因审核原因无法阐明。由于钟老师课程中未讲解第八章网络安全协议，故该笔记也不包含该部分内容。在网上查阅得知笔记应投原创，故本篇博客投的...

LLMs之Baichuan2：《Baichuan 2: Open Large-scale Language Models》翻译与解读

标签：语言模型人工智能自然语言处理

LLMs之Baichuan2：《Baichuan 2: Open Large-scale Language Models》翻译与解读目录 ...《Baichuan 2: Open Large-scale Language Models》翻译与解读 ...3 Alignment对齐=SFT+RLHF(RM+RL)